今天來介紹一個實例,假設現在我們希望能夠預測一個尚未出生的嬰兒是否會需要醫護人員的緊急照護,但我們是不是可以透過既有的資料,來預測一位尚未出生的嬰兒是否可能會在出生的時候需要醫護人員的緊急照護。在理想狀況中,每個醫護人員都能知道那些嬰兒面臨的問題,並能妥善的分配人力進行處理,但在現實中這種狀況是不可能發生的,那也就是為什麼我們想解決這個問題的原因。
我們手上有一份資料,其中包含了過往出生嬰兒的出生日期、嬰兒重量及母親年齡,而因為嬰兒的出生日期是在嬰兒出生前不會知道的,因此這個特徵無法列入訓練資料中,因此我們先來試試看以嬰兒重量及母親年齡進行模型訓練,看能不能找出什麼端倪,那我們首先將母親年齡及嬰兒重量畫成圖如下。
因為嬰兒重量是連續數字,因此我們先從迴歸分析著手,而透過觀察畫出來的圖上似乎可以看到有一條線代表著其相對應的關係。